#AI 解析
比GPU性能更強?TPU全解析(AI算力、Google、輝達、智算中心)
AI能在幾秒內處理百萬條資料,背後靠的是什麼晶片?常聽人說GPU支撐AI算力,那TPU又在起什麼作用?它和我們手機裡的晶片有本質區別嗎?實際上TPU就像AI的專屬廚師,專門做AI最需要的算力工作,不多但精準高效。一、TPU1、TPU不是一開始就為通用AI設計的很多人以為TPU從誕生就針對大模型訓練,其實它最初是Google為自家業務定製的工具。Google ML發展關鍵時間線(2011-2015)2015年前後,Google的搜尋排序、語音識別這些服務需要大量重複的數值運算,當時的GPU處理起來總有些力不從心,要麼速度不夠,要麼耗電太多。Google工程師乾脆重新設計晶片架構,把所有計算資源都集中在這類運算上,這就是第一代TPU的由來。後來大模型興起,大家才發現這種架構剛好符合AI的需求,TPU才從Google內部走向公開市場。TPU v12、TPU不用常見的快取設計普通電腦和手機晶片裡,快取是個重要部件,就像書桌邊的抽屜,常用的東西放裡面方便拿。可是TPU不怎麼依賴快取,反而用了超大頻寬的記憶體。這是因為AI運算的特點和普通計算不一樣,它需要處理海量連續的資料,比如一張圖片的像素點或者一段文字的編碼,這些資料要不斷輸入計算單元。快取的容量再大也裝不下這麼多連續資料,換成高頻寬記憶體,就能像消防水管送水一樣,把資料快速送到計算部分,反而更高效。二、晶片設計1、架構設計TPU的設計第一步就是設計架構,這就像蓋房子先畫圖紙,決定了晶片的性能上限。架構設計要先明確晶片的用途,是給大模型訓練用,還是給智能音箱這類裝置做推理用。訓練用的TPU需要更強的平行計算能力,能同時處理海量資料;推理用的TPU則更看重能效比,不能太耗電。Google最新的Trillium TPU就是典型的訓練型架構,把多個計算部分連在一起,還最佳化了資料傳輸的路徑,相比上一代訓練速度提升了4倍多,能耗反而降了不少。TPU v4 架構2、演算法適配比單純增加參數更重要設計TPU不能只看硬體參數,還要和AI演算法配合好。不同的AI模型,比如圖像識別和語言翻譯,運算邏輯不一樣。如果晶片架構和演算法不匹配,就算參數再高也沒用,就像用菜刀砍骨頭,再鋒利也不如斧頭順手。Google的TPU能在Gemini模型上做得很好,就是因為設計時針對多模態模型的運算特點做了最佳化,比如加強了對圖像和文字混合資料的處理能力。國內企業設計TPU時,也會針對政務、金融這些領域的特定演算法做調整。人工智慧模型訓練計算量趨勢圖3、IP核採購TPU設計不用所有部分都從零開始,有些通用模組可以直接買現成的IP核。IP核就像現成零件,比如記憶體控製器、介面模組這些,有專業公司專門研發銷售。買IP核能節省大量時間,不用再花幾年研發這些成熟技術,還能降低風險。大部分中小設計企業都會用這種方法,只專注於TPU主要計算部分的設計。Google這樣的大企業,為了追求最好的性能,會自己研發所有IP核,但投入的研發費用往往要數十億。三、晶圓1、矽片TPU的製造要從矽片開始,這種高純度的矽片表面光滑,純度要達到99.9999999%以上,一點雜質都可能影響晶片性能。矽片的尺寸也很重要,現在主流是12英吋矽片,一片就能切割出幾百個TPU晶片,比小尺寸矽片的效率高很多。生產矽片的過程很複雜,要經過晶體生長、切片、拋光等幾十道工序,國內的中環股份、滬矽產業都能生產這種高純度矽片,不過高端產品還需要進口。2、光刻光刻就像給矽片刻上電路圖案,是製造環節最重要的一步。這個過程需要用光刻機,把設計好的電路圖案通過雷射投射到塗了光刻膠的矽片上,再用化學藥劑蝕刻,形成電路紋理。TPU的製程越先進,光刻的難度就越大。目前主流的TPU用7奈米或5奈米製程,需要極紫外光刻機才能完成。全球能生產這種光刻機的企業很少,台積電就是靠掌握先進光刻技術,成為Google、蘋果等企業的TPU代工廠。3、摻雜工藝矽本身的導電性能一般,需要通過摻雜工藝來調整。簡單來說就是在矽片的特定區域注入硼、磷這些雜質,形成PN接面,這樣才能控制電流,讓晶片完成計算。摻雜的精度要求極高,雜質的濃度和注入深度都要精確到奈米等級。不同的計算部分,摻雜的參數不一樣,比如TPU的主要計算區域需要更高的導電效率,摻雜濃度就會高一些;而外圍的控制區則需要更穩定的性能,摻雜參數會更穩。四、封裝測試1、封裝晶圓切割成單個晶片後,下一步就是封裝。封裝主要有三個作用:一是保護晶片不受潮濕、灰塵這些外界環境影響;二是引出晶片的電極,方便和外部電路連接;三是幫晶片散熱——TPU工作時會發熱,封裝材料和結構都影響散熱效果。訓練用的TPU功率大,所以會用更複雜的倒裝封裝技術:把晶片正面朝下貼在基板上,這樣散熱路徑更短。國內像長電科技、通富微電這些企業都能做TPU封裝,技術水平和國際企業差不了多少。2、測試要過三道關封裝好的晶片不能直接出廠,得經過嚴格測試,主要有三道關。第一道是性能測試,用專門裝置給TPU輸入測試資料,檢查計算速度、精度這些指標是否符合要求——Google的TPU還會專門測試在Gemini模型上的訓練效率。第二道是穩定性測試,把TPU放在高溫高濕的環境裡連續工作幾百小時,看看會不會出故障。第三道是功耗測試,測測不同負載下的耗電量,確保符合設計要求。不合格的晶片會被標記淘汰,合格率直接關係到企業的成本。能效比例3、模組化設計現在的TPU大多用模組化封裝,把多個晶片整合到一個模組裡——比如Google的TPU Pod就是由好幾個TPU晶片組成的。這種設計有兩個好處:一是組合起來方便,根據需求拼接不同數量的模組,就能滿足不同的算力需求;二是維護起來省事,如果某個晶片壞了,只換對應的模組就行,不用把整個裝置都廢掉。智算中心裡的TPU叢集都用這種方式,維護人員不用拆開晶片,直接換模組就能解決問題,能省不少停機時間。五、材料供應1、聚氨酯材料這裡說的聚氨酯材料和晶片不是一回事,但在TPU產業鏈裡也挺重要的。汽車車衣用的就是熱塑性聚氨酯材料,彈性好、耐老化,還能防刮擦。張家界有家企業專門做這種材料,全球市場佔有率能到90%,連阿迪達斯的運動鞋都用他們的TPU膠膜來粘接。生產這種材料需要高品質的聚酯多元醇,國內的華峰化學通過收購企業,打通了從原料到成品的全鏈條,成本比進口材料低很多。2、光刻膠光刻膠是光刻環節必須用的材料,塗在矽片表面,經過雷射照射後會發生化學反應,形成可以蝕刻的圖案。光刻膠的質量直接影響電路精度,先進的5奈米製程得用極紫外光刻膠,這種材料研發難度很大,成分配比要精確到百萬分之一。現在國內企業已經能生產28奈米製程用的光刻膠,高端的還得從日本或者美國進口。光刻膠的儲存條件也挺嚴格,得放在低溫環境裡,不然會失效。3、散熱材料TPU工作時產生的熱量要是不能及時散出去,會影響性能甚至縮短壽命,所以散熱材料就很關鍵。封裝環節會用到散熱膏和散熱片:散熱膏填在晶片和散熱片之間的縫隙裡,能提高導熱效率;散熱片則增大散熱面積,把熱量傳到空氣裡。大功率的TPU叢集還需要專門的液冷散熱系統,用冷卻液把熱量帶走。國內像高瀾股份、同飛股份做的液冷系統,已經用到不少智算中心的TPU叢集裡了,散熱效率比傳統的風冷高3倍多。六、終端整合1、智算中心是TPU的主要陣地智算中心就像TPU的大本營,很多TPU在這裡組成叢集,給AI企業提供算力服務。天津移動建的TPU智算中心,通過最佳化叢集佈局和散熱系統,單位算力成本降了很多。這些智算中心會根據客戶需求,提供不同的算力套餐:比如給科研機構提供大模型訓練用的高算力服務,給中小企業提供智能客服推理用的輕量算力服務。像視拓雲這樣的企業,還把TPU算力做成了零售業務,客戶按需購買就行,不用一次性投很多錢建機房。2、汽車行業TPU在汽車行業的應用分兩種:一種是晶片,一種是材料。晶片方面,有些智能汽車的自動駕駛系統會用TPU做推理,處理攝影機和雷達傳來的路況資料,判斷行人和車輛的位置。材料方面,汽車車衣用的熱塑性聚氨酯材料越來越常見,納琳威做的真漆車衣,還能適配特斯拉賽博皮卡的不鏽鋼車身,貼合度特別高。易車和邦泰集團合作研發車用TPU粒子,做成的車衣性價比更高,已經覆蓋了從一線到三四線城市的門店。3、小型化TPU智慧型手機、智能音箱這些消費電子產品,需要的是小型、低功耗的TPU。智能音箱裡的TPU,主要負責語音識別的推理,能把使用者的語音指令快速轉成文字,還能理解意圖。這種TPU尺寸很小,有的只有指甲蓋那麼大,功耗也低,一節電池就能支援長時間工作。國內的瑞芯微、全志科技都做這類小型TPU,很多智能家電廠商都會買。有些高端耳機裡也會裝小型TPU,用來最佳化降噪演算法。Coral Edge TPU與NVIDIA GTX 1080 GPU在最大功耗和每瓦特運算性能上的對比七、市場規模情況1、全球市場增長速度很快TPU所屬的智能算力市場,這幾年漲得特別快。2024年全球AI算力市場中,GPU和TPU主導的智能算力規模超過了750億美元。有機構估計,2025年這個數字會跳到3500億美元,差不多翻五倍。這當中TPU的佔比還在慢慢上升,特別是Google推出Trillium TPU後,不少企業開始換成TPU來做訓練和推理。Meta甚至打算從2027年開始,在自家資料中心裡裝Google的TPU,這筆單子說不定能到幾十億美元呢。2、中國市場增速超過全球平均中國智能算力市場的增長速度比全球平均還要快。根據IDC和浪潮資訊的報告,2025年中國人工智慧算力市場規模能到259億美元,比去年漲了36.2%。TPU的用途現在越來越多,政務、金融、製造這些行業都在往裡面砸錢。天津、上海這些大城市都在蓋TPU智算中心,中國移動打算到2028年底建成本國最大的智算設施,裡面會裝很多國產TPU。國產TPU的市場份額也在往上走,寒武紀、華為的TPU在國內政務領域用得已經挺多了。3、不同應用場景的市場差異大TPU的市場分佈不太均勻,智算中心佔了大部分,大概能有70%以上。為何呢?因為大模型訓練和推理需要好多TPU湊成叢集,一套裝置的投入就不低。汽車行業的TPU市場漲得最快,特別是自動駕駛和車衣材料這兩塊,2025年的漲幅可能超過50%。消費電子領域的TPU市場規模不算大,但勝在穩,每個智能裝置裡都得有個小TPU,賣出去的數量特別多。材料類的TPU市場也不小,光汽車車衣和運動鞋這兩個地方,全球一年賣的錢就超過一百億美元。八、市場競爭態勢1、Google和輝達國際上TPU市場主要是Google和輝達在搶地盤,不過兩家擅長的地方不一樣。Google的TPU在AI訓練這塊優勢很明顯,特別是和自家Gemini模型搭著用的時候,效率比輝達的GPU高不少,還更省電。輝達則在生態這塊更厲害,好多AI框架都先適配GPU,企業要換成TPU得調整演算法,難度相對大一點。但這種情況正在改變,Google通過雲服務把TPU租給其他公司,Meta這樣的大公司也開始考慮用了,Google在市場上的說話份量慢慢變重了。2、國內企業細分領域國內的TPU企業沒直接和Google、輝達硬碰硬,而是從細分領域入手。寒武紀的TPU主要針對政務和金融行業,這些地方對安全性要求高,國產晶片更吃香。華為的TPU則和自家鴻蒙系統、雲服務綁在一起,在智能汽車和工業網際網路這塊推。材料領域的國內企業表現更亮眼,張家界齊匯新材料在運動鞋用TPU膠膜市場佔了全球90%的份額,邦泰集團在車用TPU粒子這塊的國內市場佔比超過60%。這些企業通過盯著細分市場做,給自己築起了一道競爭的牆。九、需求分析1、網際網路科技巨頭網際網路科技巨頭是TPU的主要客戶,尤其是那些做AI大模型的公司。Google、Meta、百度、阿里這些企業,每年都會買好多TPU搭成算力叢集,用來訓練模型和做推理。他們買TPU的時候最看重性能和穩不穩定,對價格不太在乎。Google自己做TPU,同時也把算力租給其他公司;百度則混著用國產和進口TPU,重要業務用進口的,邊緣業務用國產的來省錢。這些巨頭買的量很大,一單就能佔企業年銷售額的20%以上。2、製造企業製造企業買TPU主要用在兩個地方,一是生產線上的智能檢測,用TPU處理攝影機拍的產品圖片,找出缺陷;二是生產TPU材料做的東西,比如汽車零件、運動鞋材料。這些企業買的時候最看重性價比,不會瞎買高端產品。汽車零件廠商會選國產的中低端TPU晶片,足夠滿足檢測需求,價格比進口的低30%以上。買材料這塊,他們會和供應商長期合作,比如阿迪達斯就把齊匯新材料當成最大的TPU膠膜供應商,兩家還一起研發新產品。3、科研機構和政務部門科研機構和政務部門買TPU,安全是第一個要考慮的。高校和科研院所買TPU主要用來研發AI演算法,他們需要晶片能靈活擴展,適配不同的實驗場景。政務部門買的TPU則主要用在人口統計、交通管理這些地方,資料很敏感,必須用通過安全認證的國產晶片。寒武紀的TPU就通過了好幾個政務安全認證,在好多城市的智能交通系統裡都在用。這些客戶買的量雖然不如巨頭,但訂單穩,給錢也比較快。十、TPU和GPU誰更厲害1、訓練場景TPU更有優勢在AI模型訓練場景裡,尤其是大模型訓練,TPU的優勢很明顯。因為訓練過程需要反覆做矩陣運算,TPU的架構就是專門為這個做的,所有計算資源都集中在這事兒上,沒有多餘功能浪費資源。Google的Trillium TPU訓練Gemini模型時,速度比輝達最新的GPU快4倍,能耗卻低67%。這就意味著訓練同一個模型,用TPU能省好多時間和電費,對經常要訓練模型的企業來說,這筆省下來的錢可不少。2、推理場景兩者各有千秋推理場景就是模型訓練完後,處理實際資料的過程,比如語音識別、圖像分類。這種場景下TPU和GPU各有各的好,得看具體用在那兒。如果是單一任務的大量推理,比如智能音箱的語音識別,TPU更高效,成本也更低。如果是複雜的多工推理,比如自動駕駛同時處理路況、行人、交通燈這些資訊,GPU的通用性更強,能同時處理不同類型的運算,更佔優勢。好多企業會混著用,簡單任務用TPU,複雜任務用GPU。3、生態完善度GPU領先雖然TPU在性能上有優勢,但GPU的生態更成熟,這也是好多企業不願換的原因。現在市面上大部分AI框架、演算法庫都是先適配GPU的,企業要是改用TPU,得重新調整演算法程式碼,還要培訓工程師,花的錢不少。Google為了打破這個局面,做了兩件事:一是開放自己的AI框架,讓開發者更容易適配TPU;二是通過Google雲提供TPU算力服務,企業不用自己買晶片,直接租就能用,降低了換用的難度。隨著越來越多企業試著用,TPU的生態也在慢慢變好。 (小叔報告)
【重磅】美國"第二個曼哈頓計畫":全球AI霸權爭奪戰的深度解析
大家好,我是老莊。今天給大家帶來一篇分析報導《美國"第二個曼哈頓計畫":全球AI霸權爭奪戰的深度解析》一、美國"第二個曼哈頓計畫"根據11月22日戰略與國際問題研究中心的報導:美國政府和業界呼籲啟動‘第二個曼哈頓計畫’,聚焦人工智慧領域,以確保美國技術領先地位。美中經濟與安全審查委員會建議啟動類似倡議,協調公共和私營部門資源。7月,美國能源部長克里斯·賴特提出復興核能支援該計畫。同時,xAI公司等企業加速建設人工智慧基礎設施,如千兆瓦級電力設施和資料中心。陸軍通過‘FUZE項目’等舉措推動現代化,包括改造基地支援資料中心及礦物精煉廠,強化人工智慧能力。陸軍不僅負責物理安全,還整合反情報、網路安全等團隊保障關鍵基礎設施安全,確保人工智慧發展不受干擾。從美國"第二個曼哈頓計畫"的名稱可以看出美國對於這個計畫的重視。下面是我的深度分析和報導內容。二、曼哈頓計畫曼哈頓計畫是美國陸軍部於1942年6月開始實施的利用核裂變反應研製原子彈的重大計畫。這一計畫誕生於第二次世界大戰的關鍵時期,背景極為特殊。1939年,愛因斯坦致信羅斯福總統,警告納粹德國可能正在研發原子武器,並在信中明確指出:"某些近期工作使我相信,鈾元素可能成為一種新型的重要能源......這種新現象也將導致炸彈的構造變化"。這封信件引發了美國高層的極大關注,珍珠港事件後,美國參戰,最終在1941年12月6日,即日本偷襲珍珠港的前一天,正式批准了原子彈研製計畫。曼哈頓計畫集中了當時西方國家(除納粹德國外)最優秀的核科學家,動員了10萬多人參與這一工程,歷時三年,耗資20億美元(相當於2020年的254億美元)。在工程執行過程中,負責人格羅夫斯和奧本海默創造性地應用了系統工程的思路和方法,大大縮短了工程所耗時間,這一成功也促進了二戰後系統工程的發展。實施特點與戰略價值曼哈頓計畫的實施展現了多個突出特點,這些特點也成為後來大型國家科技工程的典範:前所未有的資源集中:羅斯福總統賦予該計畫"高於一切行動的特別優先權"。在計畫巔峰時期,曾起用了53.9萬人,總耗資高達25億美元,其資源集中程度在美國歷史上罕有其匹。多路徑平行推進:由於當時不知道分裂鈾-235的三種方法那種最好,曼哈頓計畫採取了三種方法同時進行裂變工作的策略。這種多路徑平行的技術策略有效降低了研發風險,保證了項目整體進度。軍事與科學的高效結合:在參謀長聯席會議主席馬歇爾的支援下,美國軍方同意按照原S-1委員會的建議,開始建設四種分別採用不同方法的鈾同位素分離工廠。而格羅夫斯上校(後晉陞為準將)接管計畫後,在不到48小時內就將計畫優先權升至最高級,並選定田納西州的橡樹嶺作為鈾同位素分離工廠基地。獨特的組織管理模式:為確保科學家能夠充分發揮創造力,曼哈頓計畫採取了獨特的組織管理模式。儘管計畫由軍方領導,但格羅夫斯同意加州大學成為洛斯阿拉莫斯實驗室的名義管理單位,基地軍隊只負責實驗室建設、後勤供應和安全保障,保證了實驗室內部的自由學術討論。曼哈頓計畫於1945年7月16日成功進行了世界上第一次核爆炸試驗,並按計畫製造出兩顆實用原子彈,標誌著核時代的來臨。這一計畫不僅促進了二戰後系統工程的發展,更從根本上改變了世界戰略格局和戰爭形態,為戰後國際秩序奠定了基礎。三、兩個"曼哈頓計畫"的異同分析戰略目標與時代背景的差異原版曼哈頓計畫與"第二個曼哈頓計畫" 雖然都被賦予國家戰略優先順序,但其戰略目標和時代背景存在顯著差異。原版曼哈頓計畫是在二戰期間實施的緊急戰時計畫,目標單一而明確——搶先納粹德國研製出原子彈。而川普政府推出的"創世紀行動"(Genesis Mission)則旨在確保美國在人工智慧領域的全球領導地位,其本質是一場關於算力霸權的國家競爭。從戰略緊迫性來看,原版曼哈頓計畫面對的是明確的、急迫的安全威脅——納粹德國的核武器計畫,具有明確的倒計時性質。而"第二個曼哈頓計畫"則是對長期性、系統性戰略競爭的響應,針對的是美國認為可能挑戰其技術霸權地位的國家,特別是中國。兩者的對比如下:原曼哈頓計畫:應對現實存在的戰爭威脅,目標具體、時間緊迫。第二個曼哈頓計畫:應對未來戰略競爭,目標廣泛、時間跨度長。實施主體與協作模式的轉變在兩個計畫的實施主體和協作模式上,也體現出顯著的時代差異:原曼哈頓計畫:由美國陸軍部主導,政府、軍方與科研機構緊密合作,但國際協作有限,主要與英國、加拿大合作。第二個曼哈頓計畫:體現出軍民融合的特點,聯邦政府提供政策支援和資源協調,但私營企業如OpenAI、輝達等扮演核心技術角色,且國際合作更加複雜,包括與沙烏地阿拉伯等國的晶片合作。技術特徵與資源需求的不同原曼哈頓計畫與"第二個曼哈頓計畫"在技術特徵和資源需求方面也存在本質區別:原曼哈頓計畫:依賴於物理和化學領域的突破,核心挑戰是核裂變材料生產和原子彈結構設計。資源需求主要集中在特殊材料(如鈾礦石)和工業生產能力上。第二個曼哈頓計畫:以數位技術為核心,依賴算力、演算法和巨量資料三大基礎。資源需求更加多元化,包括高端晶片、海量資料、電力能源和人才資源。表:兩個"曼哈頓計畫"關鍵維度對比保密與開放之間的平衡差異兩個計畫在知識管控方面採取了截然不同的策略。原曼哈頓計畫實施了極其嚴格的保密制度,科學探索成為軍事機密的重要組成部分。政府對所有核研究實施了嚴格的新聞檢查和保密措施,與戰前科學界的開放交流形成鮮明對比。相比之下,"第二個曼哈頓計畫"則採取了更為複雜的知識管控策略。一方面,川普政府的《美國人工智慧行動計畫》將開源AI技術列為戰略資產,鼓勵共享;另一方面,又通過晶片位置驗證技術,精準阻斷先進計算晶片流向特定國家,並完善對半導體製造裝置的出口管制,編織覆蓋全球的"技術流動過濾網"。這種選擇性開放與精準封鎖相結合的策略,反映了數字時代技術控制的複雜性。四、全球格局:主要國家的AI戰略佈局美國的全方位AI戰略體系美國推出的"第二個曼哈頓計畫"——"創世紀行動"(Genesis Mission),是一套全方位、多層次的AI戰略體系。該計畫由多個關鍵組成部分構成:政策法規層面:通過行政命令強制掃除監管障礙,授權司法部起訴那些制定"違憲"AI法規的州政府。川普政府還明確表示,對於試圖通過繁瑣安全測試、版權審查或以"倫理"為名限制AI發展的州,聯邦政府將揮舞削減資金的大棒。國際合作層面:積極開展技術外交與聯盟建構,如批准向沙烏地阿拉伯出售最先進的AI晶片,換取沙烏地阿拉伯資金支援。同時,輝達與馬斯克旗下的xAI宣佈,將與沙烏地阿拉伯支援的AI風投機構Humain合作,建立大型資料中心。產業供應鏈層面:推動供應鏈本土化,如OpenAI與富士康聯手在威斯康星州等地的美國工廠設計並製造下一代AI基礎設施硬體。這一合作旨在建構完全位於美國境內的、具有韌性的AI供應鏈,從晶片到機架,從冷卻液到電源模組,將AI物理層的控制權牢牢掌握在手。能源保障層面:能源部被賦予極高的戰略地位,因為未來的AI競爭,本質上是一場能源競爭。美國計畫建立"雲端自動化實驗室",利用AI加速從材料科學到生物學的全方位研究。中國的AI發展戰略與應對面對美國的AI戰略佈局,中國正在形成自己的AI發展路徑。中國發展AI的優勢主要體現在:豐富的應用場景:中國擁有龐大的國內市場,在智慧城市、工業網際網路、智慧醫療、自動駕駛等領域,形成了無可比擬的"超級試驗場"。這使中國企業有機會走出一條"應用反哺技術"的路徑,在解決實際痛點中打磨出具有中國場景特色的差異化競爭力。技術突破:中國已在AI技術領域取得一系列突破,如華為昇騰系列晶片在AI推理市場佔比超70%,DeepSeek模型以低算力實現高效率,打破了"唯算力論"的迷思。開放合作:中國正建構"去美國中心化"的AI生態圈,通過"一帶一路"等多雙邊框架,推動AI技術務實合作。例如,在東南亞、非洲推廣智能農業技術,在開發中國家部署AI醫療輔助系統。其他主要國家的戰略應對在全球範圍內,其他主要國家也紛紛制定了AI發展戰略:歐盟:早期通過"尤里卡計畫"(EUREKA)推動歐洲高科技合作,現在正致力於在技術主權與倫理監管之間尋求平衡。歐盟傾向於通過《人工智慧法案》等法律框架,建構可信AI的發展環境。日本:早在1980年代就提出了"技術立國"戰略,現在繼續加強在AI領域的研究與發展,但在基礎研究和原創技術方面面臨挑戰。俄羅斯:其科技發展模式有著獨特特點,歷史上曾執行過類似曼哈頓計畫的大型科學計畫,如斯大林時期的石油科研計畫。在AI領域,俄羅斯可能更注重AI在國家安全和軍事領域的應用。表:全球主要國家/地區AI戰略比較五、美國"第二個曼哈頓計畫"的深層動因技術霸權與國家安全的雙重考量美國推出"第二個曼哈頓計畫"的背後,是對於技術霸權旁落的深切焦慮。《美國人工智慧行動計畫》開宗明義,將AI定位為決定21世紀國家命運的終極"戰略制高點",認為誰主宰AI,誰就掌控科技命脈、經濟引擎與軍事利刃,進而定義全球秩序。該計畫的終極目標是建立"無可置疑、無可挑戰的全球技術主導權"。從國家安全形度看,美國軍方認識到AI技術正在成為新的戰略威懾力量,類似於冷戰時期的核武器。正如原版曼哈頓計畫是為了防止納粹德國率先獲得核武器一樣,"第二個曼哈頓計畫"旨在防止競爭對手在AI領域取得領先。美國國防部牽頭為軍事用途的AI資料中心制定"新的技術標準",以抵禦"最堅定、最有能力的民族國家行為者的攻擊",這充分反映了AI技術在國家安全的極端重要性。經濟競爭與產業發展的現實需求在經濟層面,AI技術已成為新一輪產業革命的核心驅動力。川普在沙烏地阿拉伯投資會議上的表態充分體現了這一點:"我們將與合作夥伴一起,建立世界上最大、最強大、最具創新性的AI生態系統"。這種對AI生態系統的重視,源於對AI帶動經濟增長和產業升級的期待。AI產業的發展直接關係到全球價值鏈重構中的國家地位。通過OpenAI與富士康的合作,美國試圖將供應鏈從"美國設計、亞洲製造"的分工模式,轉向完全位於美國境內的、具有韌性的供應鏈。這不僅關乎AI產業本身,更關係到未來製造業的整體競爭力。地緣政治與聯盟體系的重塑動力在地緣政治層面,"第二個曼哈頓計畫"成為美國重塑全球聯盟體系的重要工具。該計畫明確提出向核心盟友("小院")開放全套AI技術堆疊(硬體、模型、軟體),以技術共享深化戰略繫結,構築排他性技術圈層。這種技術聯盟的建構,與冷戰時期西方聯盟體系有著驚人的相似性。同時,美國在國際組織層面,於聯合國、國際電信聯盟(ITU)等平台強力推銷符合美國技術路徑的AI標準,並主導如人臉識別等敏感領域的全球規則制定,搶佔治理制高點。這種規則與標準的競爭,反映了美國試圖通過"第二個曼哈頓計畫"不僅保持在AI技術本身的領先,還要掌握AI治理和國際規則制定的話語權。六、中國影響:面臨的挑戰與機遇技術"卡脖子"的風險加劇美國"第二個曼哈頓計畫"對中國最直接的影響是技術封鎖的進一步加強。美國對華技術管制已升級至"外科手術"等級:運用晶片位置驗證技術,精準阻斷先進計算晶片流向特定目標;完善對尖端半導體製造裝置的出口管制,堵死"漏網之隙"。同時,利用關稅、政策協調等手段,施壓盟友採取同步管制措施,編織一張覆蓋全球的"技術流動過濾網"。這種全方位、精準化的技術封鎖,使得中國AI產業面臨嚴峻的"卡脖子"困境。高端晶片獲取難如登天,先進演算法接觸受阻,直接威脅大模型研發的算力根基,拖慢迭代步伐;半導體製造裝置的嚴控,更讓晶片產業自主升級之路成本陡增、道阻且長。特別是在訓練下一代AI模型所需的高端晶片和資料中心技術方面,中國可能面臨供應鏈斷裂的風險。國際合作空間受到擠壓美國的"第二個曼哈頓計畫"還包括建構排他性的技術聯盟,這將對中國的國際科技合作空間形成擠壓。計畫中明確提出由商務部牽頭,建立一個旨在向盟友和夥伴"出口其完整的人工智慧技術堆疊——硬體、模型、軟體、應用和標準"的計畫。這標誌著美國將系統性地捆綁其技術優勢,以鞏固地緣政治聯盟。中國AI企業"出海"過程中,將面臨美國主導的技術聯盟和標準體系設定的"玻璃門",尤其在智能駕駛、人臉識別等應用領域,規則話語權的缺失可能導致市場准入障礙重重。中國在聯合國、國際電信聯盟等國際組織中的影響力也可能受到美國有計畫的制衡。倒逼自主創新的歷史機遇儘管面臨嚴峻挑戰,但美國的技術封鎖也可能成為倒逼中國自主創新的強大動力。近年來,中國在AI領域的突破已有端倪,如華為昇騰系列晶片在AI推理市場佔比超70%,DeepSeek模型以低算力實現高效率,打破了"唯算力論"的迷思。外部高壓必將促使中國在基礎研究與核心技術攻堅上加倍投入,推動產業鏈從"整合組裝"向"核心自主"的深刻轉型。歷史經驗表明,技術封鎖往往是一把雙刃劍。原版曼哈頓計畫雖然使美國一度壟斷核武器技術,但最終蘇聯、英國、法國、中國等國都相繼實現了核技術的自主突破。同樣,在AI領域,美國的封鎖可能短期內延緩中國的發展速度,但長期來看,難以阻止中國實現技術自主。"負責任AI"的標竿機遇美國激進"去監管"可能引發的倫理失控、安全風險,反襯出中國堅持發展與規範並重道路的潛在價值。若中國能在AI倫理治理、資料安全等領域形成成熟可信的"中國方案",將極大提升國際形象與治理話語權,開闢更廣闊的合作空間。中國於2025年7月26日倡議成立世界人工智慧合作組織,初步考慮總部設在上海,希望利用中國特別是上海人工智慧先發優勢,凝聚國際共識,促進務實合作,讓人工智慧真正造福全人類。這一舉措表明,中國正試圖通過強調AI發展的普惠性和包容性,與美國的技術霸權形成對比,爭取國際社會的理解與支援。七、啟示與建議:中國的破局之路強化自主創新,突破核心技術瓶頸面對美國"第二個曼哈頓計畫"的全面圍堵,中國的根本出路在於強化自主創新能力,突破AI核心技術瓶頸。具體而言:晶片領域:需要集中力量攻克AI晶片的設計、製造和封測全環節技術難關。華為昇騰系列晶片的成功已經證明了中國在晶片設計領域的能力,下一步需要打通全產業鏈,降低對外部技術依賴。演算法與模型:應當鼓勵像DeepSeek這樣以低算力實現高效率的技術路徑創新,在基礎模型、高效訓練推理框架的研發上持續投入,以"巧實力"彌補可能的"硬差距"。開源生態建設:建構自主可控的AI開源生態,形成從底層框架、開發工具到應用場景的完整技術堆疊,避免在軟體生態層面受制於人。發揮市場優勢,深化應用場景驅動中國最大的優勢在於龐大的國內市場和豐富的應用場景。應當充分利用這一優勢:推進AI與實體經濟深度融合:在智能製造、智慧城市、醫療健康、農業等傳統產業領域,加快AI技術的落地應用,通過場景應用反哺技術創新。打造行業示範案例:選擇中國具有優勢的產業領域,打造一批具有國際影響力的AI應用示範項目,形成可複製、可推廣的解決方案。鼓勵中小企業創新:通過政策引導和市場機制,激發中小企業在AI應用創新方面的活力,形成大中小企業融通發展的產業生態。建構合作網路,拓展國際發展空間在美國建構排他性技術聯盟的背景下,中國需要更加靈活地拓展國際合作空間:深化"一帶一路"AI合作:通過在東南亞、非洲等地區推廣智能農業技術、AI醫療輔助系統等,建構"去美國中心化"的AI生態圈,實現互利共贏。參與全球規則制定:在國際標準組織(ISO、IEC、ITU)及聯合國框架下,積極參與甚至主導AI安全、倫理、互操作性等關鍵標準的制定,提供基於實踐的"中國方案"。保持與美國的技術交流:儘管面臨封鎖,但仍需通過各種管道保持與美國學界、企業界的技術交流,利用開源社區和國際科學合作平台,吸收全球創新養分。夯實數字基建,佈局能源支撐體系AI競爭的背後是算力基礎設施和能源支撐體系的競爭。中國需要:建構全國一體化算力體系:通過"東數西算"等國家工程,最佳化算力資源佈局,提升算力使用效率。加強綠色能源與AI融合:前瞻佈局AI與核能、可再生能源結合的技術路線,確保未來AI發展的能源需求得到滿足。推動基礎設施建設:加強資料中心、通訊網路等數字基礎設施建設,同時注重能效提升和環境影響控制。完善治理體系,保障AI安全可控在美國激進"去監管"的背景下,中國可以通過建構負責任AI治理體系形成對比優勢:發展與規範並重:在鼓勵AI創新的同時,建立健全AI倫理、安全和隱私保護規範,實現技術創新與有效監管的平衡。探索敏捷治理模式:針對AI技術發展快、迭代頻繁的特點,探索分類分級、敏捷高效的治理模式,避免"一刀切"阻礙創新。加強AI安全研究:針對AI系統的漏洞和風險,加強安全技術研究和保障體系建設,確保AI技術應用安全可控。八、迎接智能時代的大國競爭美國"第二個曼哈頓計畫"的推出,標誌著全球AI競爭進入了一個新的歷史階段。與原版曼哈頓計畫不同,這場競爭並非在戰爭背景下展開,但其對國際格局的影響可能同樣深遠。對中國而言,這既是前所未有的挑戰,也是歷史性的機遇。中國在AI領域有著自身的獨特優勢:龐大的市場、豐富的資料資源、強大的工程化能力和較為完整的產業體系。通過自主創新、應用驅動、開放合作和有效治理,中國完全有能力在美國的技術封鎖中開闢出一條自己的AI發展道路。這場關乎未來的AI霸權爭奪戰,勝負遠未分曉。中國若能持續在核心技術上取得突破,在應用場景上深化落地,在治理規則上貢獻智慧,不僅能有效打破美國的戰略圍堵,更能在全球AI發展版圖上刻下鮮明的"中國坐標",最終為人類智能時代的進步貢獻不可或缺的中國力量。這場博弈,不僅是技術的較量,更是道路與智慧的考驗,其結果將深刻影響21世紀的世界格局。 (莊說)
華為昇騰910C性能深度解析:海外分析師Lennart Heim眼中的中國AI晶片新里程碑
在AI晶片的戰場上,每一款新品的發佈都牽動著全球科技界的神經。尤其當這款晶片來自中國,且身處備受矚目的華為,其意義便更加非凡。近期,華為昇騰910C AI加速器的量產消息,無疑如同在平靜水面投下巨石,激起層層漣漪。這顆被譽為“中國最強AI晶片”的面世,不僅是對華為技術實力的又一次證明,更是中國在高科技領域不屈前行的縮影。本文將基於海外分析師 Lennart Heim 的專業拆解,抽絲剝繭,深度剖析昇騰910C背後的技術構成、性能表現與戰略意義,力求還原其在全球AI晶片競爭格局中的真實份量。昇騰910C的技術構成:精巧的“雙芯合璧”, 架構設計耐人尋味並非全新架構,而是巧妙的“老將新用”?昇騰910C的“C”,或許並非意味著一次架構上的“Critical Change”,反而更像是一次站在巨人肩膀上的“Clever Combination”。 從技術本質上來看,它並非橫空出世的全新架構,而更像是一場精巧的“合體術”——將兩顆已有的昇騰910B晶片,通過先進的封裝技術巧妙地整合在一起。這背後的意味值得玩味。在先進製程受限的當下,與其耗費巨資強攻未知領域,不如退一步,在成熟製程上挖掘潛力,通過架構創新和巧妙設計實現性能躍升,這或許才是更務實且高效的路徑。 昇騰910C 的出現,恰恰印證了這種策略的可能性。然而,值得我們特別關注的是,根據 Lennart Heim 的分析,這批 910C 晶片的 “出生地” 可能並非完全在我們自主可控的產線上,而是指向了一個略顯敏感的來源——台積電。 Heim 的觀點頗具衝擊力: 這批晶片,很有可能是在更早之前,在出口管制尚未收緊之時,華為通過多方管道儲備而來。 換句話說,我們今天看到的 910C,或許是華為在西方技術封鎖前,就已提前布下的 “棋子”。如果 Heim 的推論成立,那麼昇騰 910C 的象徵意義就更加複雜和耐人尋味了。它不僅僅代表了華為在AI晶片領域的最新進展,更像是一枚時代印記,記錄著特定歷史時期下,中國科技企業在全球化浪潮中,如何巧妙周旋,積蓄力量的獨特路徑。封裝方案的“取捨之道”:性能與成本的平衡術談及晶片封裝,這並非只是簡單的 “組裝” 工藝,而是直接關乎晶片性能、功耗乃至最終成本的關鍵環節。特別是在AI晶片領域,先進封裝技術的重要性愈發凸顯。NVIDIA 之所以能在高性能AI晶片領域獨佔鰲頭,其在先進封裝技術上的持續投入與領先優勢功不可沒。然而,昇騰 910C 在封裝方案的選擇上,卻展現出一種耐人尋味的 “務實主義”。 它並沒有激進地追逐最前沿的封裝技術,而是選擇了相對成熟,技術難度更低的方案: 將兩顆獨立的 910B 晶片分別放置在各自的矽中介層上,再通過有機基板將兩個矽中介層連接起來。網圖:昇騰910B 假想拆解圖這樣的方案,在 Lennart Heim 看來,相比 NVIDIA 動輒 CoWoS 或 Foveros 等先進封裝方案,確實顯得 “遜色” 一些。 差距主要體現在晶片間的互聯頻寬上。 Heim 預計,昇騰 910C 採用的封裝方式,可能會導致晶片間頻寬比 NVIDIA 的先進方案低上 10-20 倍!網圖:昇騰910B 架構猜想圖頻寬的降低,直接影響的是晶片間資料交換的效率,進而可能限制整體性能的發揮。 這無疑是一個不小的技術 “短板”。 然而,我們也要看到這種 “取捨” 背後的考量。 更成熟的封裝方案,往往意味著更低的成本,更高的良率,以及更快的量產速度。 在當下這個特殊的時期,保證穩定量產,快速形成戰鬥力,或許比單純追求極致性能更為重要。更何況,架構的不足,可以軟體來彌補。 Heim 也敏銳地指出, 昇騰 910C 的架構特點,勢必會對使用這款晶片的工程師提出更高的要求。軟體最佳化將會成為釋放 910C 潛力的關鍵所在。 如何通過巧妙的軟體工程,最大程度地彌補硬體架構上的 “頻寬瓶頸”,將成為昇騰 910C 能否在實際應用中真正發揮價值的關鍵。 這就好比在一場賽跑中,雖然起跑線稍稍落後,但只要策略得當,後程發力,依然有機會反超。性能與技術參數:與H100的“實力差距”及“追趕之勢”客觀評估: 性能參數的“80%之說”性能,永遠是衡量晶片價值的最核心指標。 Lennart Heim 對昇騰 910C 的性能給出了較為細緻的預估。 整體來看, 910C 的性能放在當下,依然稱得上是 “實力派”, 但若與 NVIDIA 的標竿產品對標,差距依然客觀存在。在關鍵的 FP16 精度算力上, Heim 預計 910C 大約能達到 800 TFLOPS 左右。 記憶體頻寬則預估在 3.2 TB/s 左右。 這樣的資料,與 NVIDIA 2022 年推出的明星產品 H100 相比, Heim 認為, 910C 的性能大概能達到 H100 的 80%。 這是一個相對 “保守” 但也頗為中肯的評估。換句話說, 如果 H100 是一位 “滿分選手”, 那麼 910C 大約能拿到 80 分, 依然屬於 “優良” 的等級, 絕非 “不堪一擊”。 但我們也要清醒地認識到,這 20% 的差距,在日新月異的AI晶片領域,已經代表著不小的代差。更值得關注的是晶片的 “邏輯面積”。 Heim 指出, 昇騰 910C 的晶片邏輯面積,竟然比 H100 大約大了 60%! 這意味著, 在相同的性能水平下, 910C 需要消耗更多的矽片面積, 這在一定程度上反映了 910C 在架構效率和設計最佳化方面, 與 H100 依然存在差距。 “塊頭更大,力氣略遜”, 這或許是對 910C 與 H100 性能對比的一個形象寫照。代際差距:面對B200,挑戰升級如果說與 H100 相比, 昇騰 910C 尚有 “一戰之力” 的話, 那麼面對 NVIDIA 今年即將全面鋪向資料中心的 B200 系列, 技術差距就顯得更為明顯了。Heim 毫不諱言地指出, 與 B200 相比, 昇騰 910C 在各個關鍵性能指標上, 都存在著較為明顯的代差: 計算性能: 約落後 3 倍! 記憶體頻寬: 約落後 2.5 倍!( Heim 的分析中假設 910C 使用了 HBM2E 記憶體, 當然, 華為如果真的 “彈藥充足”, 採用更高規格的 HBM3 也並非不可能, 但即便如此,要追平 2.5 倍的頻寬差距,依然難度巨大。) 能效比: 更是與 NVIDIA 最新的 B200 產品拉開了明顯差距。這意味著, 如果說 910C 在 2022 年還能勉強站在 H100 的 “影子” 下, 那麼到了 2025 年, 面對性能全面升級的 B200, 910C 的競爭力無疑將進一步被削弱。 技術代際的鴻溝, 客觀存在, 不容迴避。供應鏈與生產:撲朔迷離的“來源之謎”與自主可控的“本土猜想”“台積電暗度陳倉”? 令人震驚的供應鏈推論晶片供應鏈,向來是科技領域最敏感,也最受關注的環節之一。 特別是對於華為這樣身處 “風暴眼” 的企業, 其晶片的來源, 更是牽動著無數人的神經。 Lennart Heim 在供應鏈分析上的判斷,可謂 “語出驚人”, 甚至有些 “石破天驚” 的意味。Heim 大膽推測, 華為之所以能夠在當下這個時間點, 推出昇騰 910C 這樣一款高性能 AI 晶片, 背後很可能得益於早期通過 “非正規管道”, 從台積電囤積了高達 300 萬顆 基於 7nm 工藝的昇騰晶片裸片 (dies)!300 萬顆! 這是一個令人咋舌的數字。 如果 Heim 的推論屬實, 那麼這無疑是一場 “暗度陳倉” 式的豪賭。 在出口管制收緊之前, 華為就已預判到未來的風險, 並提前佈局, 大量囤積關鍵晶片, 為未來的發展爭取了寶貴的時間和戰略空間。不僅如此, Heim 還推測, 華為可能還從三星電子手中囤積了足夠多的 HBM2E 高頻寬記憶體。 如果將晶片裸片和 HBM 記憶體這兩個關鍵要素結合起來, Heim 認為, 華為理論上可以生產出約 140 萬個 910C 加速器!140 萬個 910C! 這意味著什麼? 如果全部部署到位, 按照 Heim 對 910C 單卡算力的估算, 140 萬個 910C 所能提供的 AI 算力, 將相當於 100 萬片 NVIDIA H100 等級的 AI 算力!這是一個足以改變遊戲規則的數字。 如果華為真的擁有如此規模的 “隱藏算力”, 那麼它在全球 AI 競爭格局中的地位, 無疑將被重新評估。“國產7nm 曙光”? 自主生產能力的“猶抱琵琶半遮面”當然, 在供應鏈來源的 “謎團” 之外, 還有一個更受中國科技界關注的問題: 昇騰 910C 能否實現 “國產化” 生產? 或者說, 華為是否已經掌握了在本土產線上, 自主生產 7nm 甚至更先進製程晶片的能力?對於這個問題, Lennart Heim 的觀點相對謹慎, 也更貼近現實的 “灰色地帶”。 他認為, 華為 “應該” 具備在 7nm 節點上生產 910B 和 910C 晶片裸片的能力。 這 “應該” 二字, 意味深長, 既肯定了華為在技術研發上的實力積累, 也暗示了 “實際量產” 可能還面臨諸多挑戰和不確定性。Heim 坦言, 迄今為止, 他尚未看到 “確鑿無疑” 的證據, 例如權威機構的拆解報告, 能夠完全證實市面上流通的 910B 或 910C 晶片, 是 “Made in China” 。 因此, 他傾向於認為, 目前市面上絕大多數的 910C 晶片, “很可能” 仍然來自於 “非正規管道” 獲得的台積電產品。但 Heim 也並沒有完全排除 “國產自產” 的可能性。 他認為, 國內生產 7nm 晶片, “理論上是可能的”。 只是, 大規模量產的良率、 成本、 穩定性等問題, 可能仍然是制約 “國產 910C” 大規模問世的障礙。這種 “既有希望, 又有挑戰” 的判斷, 或許更符合中國半導體產業的真實寫照。 我們在先進製程工藝上, 確實取得了一定的突破, 但距離完全實現 “自主可控”、“規模量產”, 依然還有一段路要走。 昇騰 910C 的供應鏈 “來源之謎”, 也恰恰折射出中國科技產業, 在自主創新道路上 “摸著石頭過河” 的複雜性和艱巨性。戰略意義與全球AI競爭: 算力差距下的“差異化競爭”與“後發優勢”算力差距“客觀存在”, 戰略意義“不容低估”儘管 昇騰 910C 的性能和供應鏈來源, 依然存在諸多 “謎團” 和爭議, 但其戰略意義, 卻是不容忽視的。 Lennart Heim 從全球 AI 競爭格局的高度, 對 910C 的戰略價值, 給出了深刻的解讀。首先, Heim 坦言, 與西方最頂尖的 AI 晶片相比, 昇騰 910C 依然存在 “差距”。 這種差距, 不僅僅體現在單卡性能上, 更體現在整體的算力規模上。 Heim 預測, 到 2025 年底, 西方陣營生產的 AI 晶片數量, 將至少是中國的 5 倍 以上! 而整體的計算能力差距, 甚至可能達到 10-20 倍! 美國的 AI 算力優勢, 依然是壓倒性的。這是我們需要正視的 “硬實力” 差距。 但 Heim 的分析, 並沒有停留在簡單的 “數字對比” 上, 而是進一步深入到 “算力資源分配” 的戰略層面。 他敏銳地指出, 僅僅擁有 10 倍的計算能力, 固然是巨大的戰略優勢, 但如果這些算力資源, 分散在成百上千家不同的公司手中, 其戰略威力, 就會大打折扣。而中國, 則可能在 “資源集中” 方面, 展現出獨特的優勢。 Heim 認為, 中國可能比西方國家, “更容易實現資源集中”。 這或許才是中國 AI 戰略真正的 “王牌” 所在。集中力量辦大事, 這是中國在諸多領域屢試不爽的 “制勝法寶”。 在 AI 算力這個 “新基建” 領域, 如果中國能夠充分發揮 “資源集中” 的優勢, 將有限的算力資源, 優先投入到最關鍵、 最核心的戰略方向上, 那麼即使整體算力規模落後於西方, 依然有機會在局部領域, 甚至在某些關鍵技術方向上, 實現 “彎道超車”。“推理先行,應用突圍”? 差異化競爭的“中國路徑”展望“集中優勢算力, 實現差異化競爭”, 這或許是中國 AI 戰略的 “破局之道”。 那麼, 具體應該如何 “差異化” 競爭? Lennart Heim 也給出了他的 “中國路徑” 展望。Heim 認為, 中國在 AI 領域, 依然 “具有競爭力”。 尤其是在 AI 推理能力 方面, 中國 “可能會有更多進步”。 “推理”, 正是 AI 應用落地的關鍵環節。 相比於 “燒錢” 的 “預訓練”, “推理” 的成本更低, 更貼近實際應用場景, 也更容易產生商業價值。或許, 中國可以揚長避短, 將有限的算力資源, 更多地投入到 AI 推理晶片和推理平台的研發和部署上, 在 AI 應用的 “最後一公里” 上發力, 率先在 特定行業、 特定場景 實現 AI 應用的規模化落地。例如, 在智能城市、 智能交通、 智能製造、 安防監控等領域, 中國已經積累了大量的資料和應用場景優勢。 如果能夠將 910C 等國產 AI 晶片, 與這些應用場景深度融合, 打造出一批 “殺手鐧” 等級的 AI 應用, 那麼即使在 “通用 AI 大模型” 的預訓練方面, 暫時落後於西方, 依然可以在 AI 應用的商業化落地和產業化處理程序中, 佔據領先地位。然而, Heim 也提醒我們, “差異化競爭” 並非 “一勞永逸” 的 “萬能藥”。 他指出, 下一代 AI 預訓練, 可能需要 “新的、 更大的叢集, 需要數萬片晶片”。 而且, 要真正發揮 AI 模型的價值, 還需要將它們 “部署給數百萬使用者, 或自主運行大量 AI 智能體”。 此時, “總計算量仍然很重要”。“水桶的容量, 取決於最短的那塊木板”。 算力規模的短板, 最終依然會限制 中國 AI 發展的 “天花板”。 因此, 在 “差異化競爭” 的同時, 中國也必須持續加大在 AI 基礎設施建設和先進製程工藝研發上的投入, 努力補齊 “算力短板”, 才能在全球 AI 競爭中, 贏得更大的戰略主動權。總結與展望: 不完美但彌足珍貴, 差異化突圍的“中國式AI道路”“80% 性能” 的背後: 戰略意義遠超參數本身綜合 Lennart Heim 的深度分析, 我們可以對華為昇騰 910C 形成一個更客觀、 也更立體的認識:從單卡性能來看, 910C 或許並不 “驚豔” —— 僅相當於 H100 的 80% 左右, 且發佈時間也晚了 4 年。 如果僅僅以 “參數論英雄”, 910C 似乎並無太多 “亮點”。但如果我們跳出 “參數” 的束縛, 站在更高的戰略維度審視 910C, 就會發現, 它的意義遠不止於 “80% 性能” 本身。 在西方技術封鎖日益收緊的背景下, 華為能夠推出 910C 這樣一款高性能 AI 晶片, 本身就具有極強的象徵意義。 它證明了, 即使在 “逆境” 之中, 中國科技企業依然沒有放棄對技術高峰的攀登, 依然在努力縮小與世界頂尖水平的差距。更何況, 如果 Heim 關於 “台積電晶片囤積” 的推論成立, 那麼 910C 的戰略價值就更加凸顯了。 通過 “非正規管道” 獲得的大量晶片裸片, 再加上可能從中芯國際獲得的少量 “國產 910C”, 華為完全可以通過 “叢集更多晶片” 的方式, 來彌補單卡性能的差距, 建構起規模可觀的 AI 算力叢集。“單絲不成線, 獨木不成林”。 在 AI 時代, 算力叢集的規模效應, 往往比單卡性能的 “極致參數” 更為重要。 從這個意義上來說, 昇騰 910C 的 “價值”, 絕不能僅僅用 “80% 性能” 來簡單衡量。 它更像是華為, 乃至中國 AI 產業, 在重重圍堵之下, 巧妙利用成熟技術、 積極開拓多元化供應鏈、 並最終走出一條 “差異化突圍” 之路的 一個 “里程碑” 式的註腳。“出口管制” 並非“失效”, “AI彈性”與“防禦AI” 或成未來關鍵詞Lennart Heim 在文章的最後, 也對西方的 “出口管制” 政策, 進行了反思和展望。 他認為, 昇騰 910C 的出現, “並不意味著出口管制失敗”。 關鍵是要 “理解中國能夠提供什麼, 出口管制允許什麼, 以及它們不允許什麼”。這句話, 耐人尋味, 也意味深長。 “出口管制”, 固然在一定程度上限制了中國 AI 產業的發展速度, 但卻無法完全阻止中國 AI 前進的步伐。 中國依然可以通過 “自主創新”、 “多元化供應鏈”、 “差異化競爭” 等多種方式, 在 AI 領域 “突圍”。 “出口管制” 的 “籬笆牆”, 或許可以延緩中國 AI 追趕的速度, 但卻無法 “扼殺” 中國 AI 發展的內生動力。Heim 還預告, 他將在未來撰文, 詳細闡述 “AI 彈性”、“用於防禦的 AI” 等 “補充方法”。 這或許暗示著, 在 “出口管制” 常態化的背景下, 中國 AI 發展戰略, 需要更加注重 “自主可控”, 建構更具韌性的 AI 產業鏈, 並積極探索 “防禦性 AI” 技術, 以應對未來可能面臨的 “技術脫鉤” 風險。“宜未雨而綢繆, 毋臨渴而掘井”。 面對風雲變幻的國際局勢, 中國 AI 產業的發展, 既要保持 “戰略自信”, 也要增強 “憂患意識”。 在 “自主創新” 的道路上, 我們既要腳踏實地, 埋頭苦幹, 也要仰望星空, 前瞻佈局, 才能在全球 AI 競爭的 “下半場”, 贏得更加主動, 也更有尊嚴。結語華為昇騰910C的問世,絕非一帆風順的 “王者歸來”,而更像是一場在重壓之下,展現韌性與智慧的 “突圍之戰”。 它或許並不完美,單卡性能與頂尖水平仍有差距,供應鏈來源也撲朔迷離,但它的戰略意義卻不容低估。它標誌著中國在AI晶片自主研發的道路上,又邁出了關鍵一步,也預示著在全球AI競爭格局中,中國將走出一條 “差異化競爭” 的獨特路徑。昇騰910C 的 “故事”, 遠未結束。 我們將持續關注它的實際應用表現, 以及它對中國 AI 產業帶來的深遠影響, 並為讀者帶來更多深入、 專業的解讀與分析。 中國 AI, 未來可期, 但前路漫漫, 仍需上下求索。 (AI FPGA 之戀)